基于决策树(DT)的分类和回归思想,最近提议在总体分类和回归任务中提供更高的性能。以更高的计算复杂性为代价,达到了其性能的改进。在这项工作中,我们研究了两种加速SLM的方法。首先,我们采用粒子群优化(PSO)算法来加快对当前尺寸的线性组合表示的判别尺寸的搜索。线性组合中最佳权重的搜索在计算上很重。它是通过原始SLM中的概率搜索来完成的。 PSO的SLM加速需要减少10-20倍的迭代。其次,我们利用SLM实施中的并行处理。实验结果表明,加速的SLM方法在训练时间中达到577的速度系数,同时保持原始SLM的可比分类/回归性能。
translated by 谷歌翻译
提出了一种统计注意力定位(SAL)方法,以促进本工作中的对象分类任务。 SAL由三个步骤组成:1)通过决策统计数据的初步注意窗口选择,2)注意力图改进和3)矩形注意区域的最终确定。 SAL计算本地平方窗口的软性决定分数,并使用它们来识别步骤1中的明显区域。为了适应各种尺寸和形状的对象,SAL优化了初步结果,并在步骤2中获得了更灵活形状的注意力图。最后, SAL使用步骤3中的精制注意图和边界框正则化产生矩形注意区域。作为应用程序,我们采用E-PixelHop,这是基于连续的子空间学习(SSL)的对象分类解决方案,作为基线。我们应用SAL以获取裁剪和调整大小的注意区域作为替代输入。整个图像的分类结果以及注意区域都被结合起来,以达到最高的分类精度。给出了CIFAR-10数据集上的实验,以证明SAL辅助对象分类方法的优势。
translated by 谷歌翻译
在这项工作中,研究了在广泛的监督学位下提供稳定表现的强大学习系统的设计。我们选择图像分类问题作为一个说明性示例,并专注于由三个学习模块组成的模块化系统的设计:表示学习,特征学习和决策学习。我们讨论调整每个模块的方法,以使设计相对于不同的培训样本编号具有强大的功能。基于这些想法,我们提出了两个学习系统家庭。一个人采用定向梯度(HOG)特征的经典直方图,而另一个则使用连续的subspace-Learning(SSL)功能。我们针对MNIST和Fashion-MNIST数据集测试了他们对LENET-5的性能,这是一个端到端的优化神经网络。每个图像类别类别的训练样本数量从极度弱的监督状况(即每班标记的样本标记为1个)到强大的监督状况(即4096个标记为每类标签样本),并逐渐过渡(即$ 2^n $) ,$ n = 0,1,\ cdots,12 $)。实验结果表明,模块化学习系统的两个家族比Lenet-5具有更强的性能。对于小$ n $,它们都超过了Lenet-5的优于Lenet-5,并且具有与Lenet-5相当的性能。
translated by 谷歌翻译
机器学习对图像和视频数据的应用通常会产生高维特征空间。有效的功能选择技术确定了一个判别特征子空间,该子空间可降低计算和建模成本,而绩效很少。提出了一种新颖的监督功能选择方法,用于这项工作中的机器学习决策。所得测试分别称为分类和回归问题的判别功能测试(DFT)和相关特征测试(RFT)。 DFT和RFT程序进行了详细描述。此外,我们将DFT和RFT的有效性与几种经典特征选择方法进行了比较。为此,我们使用LENET-5为MNIST和时尚流行数据集获得的深度功能作为说明性示例。其他具有手工制作和基因表达功能的数据集也包括用于性能评估。实验结果表明,DFT和RFT可以在保持较高的决策绩效的同时明确,稳健地选择较低的尺寸特征子空间。
translated by 谷歌翻译
已经提出了多种对抗性攻击,并使用图像和音频数据进行了探索。众所周知,当攻击者可以直接操纵模型的输入时,这些攻击很容易生成,但是在现实世界中实施更加困难。在本文中,我们提出了通用的,对通用时间序列数据的通用时间不变攻击,以便该攻击具有主要由原始数据中存在的频率组成的频谱。攻击的通用性使其快速,易于实现,因为不需要将其添加到输入中,而时间不变性对于现实世界部署很有用。此外,频率约束确保攻击可以承受过滤。我们证明了攻击在两个不同领域的有效性,即语音识别和意外的辐射排放,并表明该攻击对共同的转换和能力防御管道是有力的。
translated by 谷歌翻译
Covid-19大流行,仍然是未知的,是一个重要的开放问题。有猜测蝙蝠是可能的起源。同样地,有许多密切相关的(电晕)病毒,例如SARS,发现通过练习圈传递。对潜在的载体和致命病毒发射器的不同主体的研究对于了解,减轻和预防当前和未来的流行性至关重要。在冠状病毒中,表面(S)蛋白或尖峰蛋白是确定宿主特异性的重要组成部分,因为它是病毒与宿主细胞膜之间的接触点。在本文中,我们将超过五千个冠状病毒的刺激蛋白序列分类,将它们分离成艾滋病,蝙蝠,骆驼,猪,人类和奶酪中明显宿主的集群,以命名几个。我们提出了一种基于众所周知的位置重量矩阵(PWM)的特征嵌入,我们呼叫PWM2VEC,并用于从这些冠状虫病毒的尖峰蛋白序列产生特征向量。虽然我们的嵌入受到PWMS在生物应用中的成功,例如确定蛋白质功能,或识别转录因子结合位点,但我们是在来自病毒序列的宿主分类的上下文中使用PWM的第一个(我们的知识)生成固定长度的特征矢量表示。现实世界数据的结果显示,与使用PWM2VEC,与基线模型相比,我们能够相当良好地执行。我们还使用信息增益来测量不同氨基酸的重要性,以显示对预测给定冠状病毒的宿主来说重要的氨基酸。
translated by 谷歌翻译
神经影像动物和超越的几个问题需要对多任务稀疏分层回归模型参数的推断。示例包括M / EEG逆问题,用于基于任务的FMRI分析的神经编码模型,以及气候或CPU和GPU的温度监测。在这些域中,要推断的模型参数和测量噪声都可以表现出复杂的时空结构。现有工作要么忽略时间结构,要么导致计算苛刻的推论方案。克服这些限制,我们设计了一种新颖的柔性等级贝叶斯框架,其中模型参数和噪声的时空动态被建模为具有Kronecker产品协方差结构。我们的框架中的推断是基于大大化最小化优化,并有保证的收敛属性。我们高效的算法利用了时间自传矩阵的内在riemannian几何学。对于Toeplitz矩阵描述的静止动力学,采用了循环嵌入的理论。我们证明了Convex边界属性并导出了结果算法的更新规则。在来自M / EEG的合成和真实神经数据上,我们证明了我们的方法导致性能提高。
translated by 谷歌翻译
最近,使用自动编码器(由使用神经网络建模的编码器,渠道和解码器组成)的通信系统的端到端学习问题最近被证明是一种有希望的方法。实际采用这种学习方法面临的挑战是,在变化的渠道条件(例如无线链接)下,它需要经常对自动编码器进行重新训练,以保持低解码错误率。由于重新培训既耗时又需要大量样本,因此当通道分布迅速变化时,它变得不切实际。我们建议使用不更改编码器和解码器网络的快速和样本(几射击)域的适应方法来解决此问题。不同于常规的训练时间无监督或半监督域的适应性,在这里,我们有一个训练有素的自动编码器,来自源分布,我们希望(在测试时间)使用仅使用一个小标记的数据集和无标记的数据来适应(测试时间)到目标分布。我们的方法着重于基于高斯混合物网络的通道模型,并根据类和组件条件仿射变换制定其适应性。学习的仿射转换用于设计解码器的最佳输入转换以补偿分布变化,并有效地呈现在接近源分布的解码器输入中。在实际MMWAVE FPGA设置以及无线设置共有的许多模拟分布变化上,使用非常少量的目标域样本来证明我们方法在适应时的有效性。
translated by 谷歌翻译
Dataset distillation has emerged as a prominent technique to improve data efficiency when training machine learning models. It encapsulates the knowledge from a large dataset into a smaller synthetic dataset. A model trained on this smaller distilled dataset can attain comparable performance to a model trained on the original training dataset. However, the existing dataset distillation techniques mainly aim at achieving the best trade-off between resource usage efficiency and model utility. The security risks stemming from them have not been explored. This study performs the first backdoor attack against the models trained on the data distilled by dataset distillation models in the image domain. Concretely, we inject triggers into the synthetic data during the distillation procedure rather than during the model training stage, where all previous attacks are performed. We propose two types of backdoor attacks, namely NAIVEATTACK and DOORPING. NAIVEATTACK simply adds triggers to the raw data at the initial distillation phase, while DOORPING iteratively updates the triggers during the entire distillation procedure. We conduct extensive evaluations on multiple datasets, architectures, and dataset distillation techniques. Empirical evaluation shows that NAIVEATTACK achieves decent attack success rate (ASR) scores in some cases, while DOORPING reaches higher ASR scores (close to 1.0) in all cases. Furthermore, we conduct a comprehensive ablation study to analyze the factors that may affect the attack performance. Finally, we evaluate multiple defense mechanisms against our backdoor attacks and show that our attacks can practically circumvent these defense mechanisms.
translated by 谷歌翻译
Blind image quality assessment (BIQA) remains challenging due to the diversity of distortion and image content variation, which complicate the distortion patterns crossing different scales and aggravate the difficulty of the regression problem for BIQA. However, existing BIQA methods often fail to consider multi-scale distortion patterns and image content, and little research has been done on learning strategies to make the regression model produce better performance. In this paper, we propose a simple yet effective Progressive Multi-Task Image Quality Assessment (PMT-IQA) model, which contains a multi-scale feature extraction module (MS) and a progressive multi-task learning module (PMT), to help the model learn complex distortion patterns and better optimize the regression issue to align with the law of human learning process from easy to hard. To verify the effectiveness of the proposed PMT-IQA model, we conduct experiments on four widely used public datasets, and the experimental results indicate that the performance of PMT-IQA is superior to the comparison approaches, and both MS and PMT modules improve the model's performance.
translated by 谷歌翻译